CC 知识库

简介

Seedance 2.0 长视频制作完整方法论： ① 视频延长法——从尾巴接，最简单 ② 混合延长法——图片锚定 + 提示词驱动，角色一致性最强 ③ 九宫格法——批量出图，快速试镜头 ④ 故事板法——按剧本顺序，严肃长片首选。附赠：文戏长台词切分法则 + 结构化提示词写法。

字幕

00:00 今天和大家去分享如何用集梦制作长视频 00:02 那长视频不是一次性生成120秒 00:04 而是把长视频拆成可控的短段落 00:07 短镜头和可拼接的视觉连续性的镜头 00:10 长视频的本质非常简单 00:11 就是短段落的不断拼接 00:13 那4~5秒是一个最优的一个段落的形式 00:16 大家不要去低于四秒 00:18 那也不要去超过五秒的这个区间 00:21 那短镜头更容易去控制动作 00:23 口型情绪和连续性 00:25 那多个镜头合成一个段落的时候 00:27 我们单个段落也不要超过15秒啊 00:30 为什么我们刚才去说不要超过15秒 00:33 或者是最短不要低于四秒 00:35 其实这个是基于集梦的c dos2.0 00:37 这个产品来进行制作和考虑的 00:40 那我们来看集梦的一个视频 00:42 首先我们在选择时长的时候 00:44 它最短的时候就是四秒 00:46 所以我们在写提示词的时候 00:48 你不要写什么零到两秒产生什么镜头 00:51 它就是四秒 00:52 同时它最长就是15秒 00:54 如果你的时长超过了15秒 00:56 那你就要放到下一个视频生成当中 00:59 你不要直接在这个里头写一个什么 01:01 20秒的视频内容 01:03 不要这样写 01:04 那同时呃一般一集就是短视频的一集 01:08 就是9~12秒一集 01:10 也就是如果我们按15秒最长来制作的话 01:13 就是八段拆成6~8个画面 01:16 然后我们进行生成 01:17 然后拼接那长视频的制作方法 01:19 我们按素材的方法来看呢 01:21 其实有四个 01:22 我自己总结了四个做长视频的方法 01:25 第一个叫做视频延长 01:26 也就是以前一段视频作为导入 01:29 生成下一段视频 01:30 这个是非常非常简单的 01:32 只要你会生成视频 01:33 只要你会写基本的提示词 01:35 都可以生成非常长的视频啊 01:37 但是它也有一点的缺陷 01:39 那我们稍后会跟大家去分享 01:40 第二个叫混合延长 01:42 就是在整个长视频当中 01:44 有的视频我是用视频声视频延长的 01:46 有的视频我是用图声视频引进行延长的 01:49 也就是用手针去控制它的连续性与景别的切换 01:52 那第三种就是九宫格 01:54 就是生成多张九宫格的图片 01:56 然后把这张图片作为参考 01:58 让集梦的c dance2.0生成独立的视频 02:01 然后再将视频统一的拼接起来 02:03 那最后一个就是最近非常火的故事版 02:05 就是每张故事版他是单独生成的视频 02:08 然后最后也是按照剧本的节奏拼接起来 02:11 那其实故事版就是九宫格的一个变种 02:14 一个更高级的玩法 02:15 那首先我们来看一下视频延长 02:17 那视频延长是最直接的接龙玩法 02:21 只要你接触了AI声视频 02:22 那这个方法你是绕不过的 02:24 那它的具体生成的逻辑是什么样子呢 02:27 我们来看一下 02:28 首先我们先生成一个15秒的视频 02:31 我们点击看一下秦若虽然你是亲生的 02:35 但瑶瑶陪了我们18年 02:38 这份感情不是说断就能断的 02:41 好注意这个镜头 02:42 这个镜头就是这个视频最后的这个镜头好 02:45 这是女主去看向另外两个人 02:48 那我把这个视频作为输入告诉吉梦 02:51 帮我针对这个视频继续延长15秒 02:54 就这么简单 02:55 继续延长15秒 02:56 我们来看这个镜头的开头 02:58 就是第一段镜头的结尾 03:00 我们不能没有 03:02 他是第一段视频的结尾 03:05 这个镜头是不是第一段视频的最后的这个镜头 03:09 也就是你用视频延长的方法 03:10 这两个视频就是完美的拼接到一起了 03:13 我们来看我们不能没有它 03:15 希望你能理解妈妈的苦衷 03:17 好当然当然我们也可以生成生成完这个视频 03:21 你继续以这个视频再生成 03:23 下一段都是偶都是可以的 03:25 好我们现在看一下 03:26 如果是这个样子 03:27 我们就把这两段视频拼接起来 03:29 我们注意看他的盖的15秒 03:31 虽然你是亲生的 03:33 但瑶瑶陪了我们18年 03:36 这份感情不是说断就能断的 03:38 好注意马上就要拼接了 03:40 然后进入第二段 03:41 这个地方就进入了第二不能没有他好 03:44 继续延长起来 03:45 希望你能理解妈妈的苦衷 03:47 好这个就是最最简单的视频延长的方法 03:51 让我们来看一下他在集梦里到底是什么样子好 03:54 我们放到集梦当中 03:56 我们来看它其实非常简单 03:58 这一个就是我们刚才看到的视频 03:59 我通过描述词0~5秒 04:02 然后6~12秒 04:03 然后13~15秒的一个镜头 04:05 把这个视频做出来 04:07 那做出来以后我把这个视频下载 04:09 然后放到我们的第二个视频里 04:12 我们不我这儿会说将上一段视频延长15秒 04:16 保持人物完全的一致 04:17 然后又开始让他去说话 04:19 这样就生成了我们刚才看到的两个视频 04:22 当我把这两个视频下载下来 04:24 我就可以到剪映里头进行拼接好 04:26 我们可以看到我把两个素材全部放到剪映当中 04:29 然后在剪映这个地方我进行一个拼接 04:32 其实非常简单 04:33 你放进来以后 04:34 它自然就拼接到了一起 04:35 但是这个地方会有一个问题 04:37 我们仔细来看这个地方会有一个卡顿 04:39 会有一个卡顿 04:40 我们仔细来看断就能断的出现了一定的卡顿 04:46 大家看到了吗 04:47 仔细看我们不能好 04:49 会卡一下 04:50 那为什么会卡一下呢 04:52 其实这个视频我们之前也和大家去讲过 04:54 为什么会卡一下 04:55 就是因为这个视频的最后一帧 04:58 和第二个视频的前一帧出现了冗余 05:02 那我们只需要把这个视频向左边裁切一点点 05:06 这个时候他的卡顿就会没有那么严重 05:09 看就自然而然的过渡过来了 05:11 自然而然的过渡过来了 05:13 好其实这个就是最简单的视频声视频 05:16 注意这有个细节 05:17 就是我们需要把这个左边往这边再挪一下 05:19 那同样我们再来看第二个案例 05:21 第二个案例也是按照我们刚才的方法进行生成 05:24 那我也是导入了三个视频 05:26 这三个视频全部都是视频声 05:28 视频第一段声完完了以后 05:29 延长第一段生成第二段 05:31 第二段生成完了以后延长第二段生成第三段 05:33 这样就可以生成无限的延长的一个情况 05:36 我们来看一下 05:37 还是仔细来看一下这个镜头子 05:39 大家仔细来看这个地方会有一个卡顿 05:41 我刚才说了 05:42 为什么会卡顿 05:42 是因为前一段视频和后一段视频的最后一帧 05:45 重复了 05:46 是AI为了让它更好的连续有一个冗余 05:51 好大家看到了这个卡顿是更明显的 05:53 大家仔细去看这个画面 05:57 卡对卡了一下 05:58 那处理方法还是一样的 06:00 我们只需要把前面这段冗余的地方 06:03 给他往后拉一下啊 06:05 拉一下 06:05 把这个地方切掉 06:06 我们再来看诶 06:09 他就很好的衔接过来了 06:10 我们再来看好他这个卡顿就消失了啊 06:15 这个就是最简单的视频声视频的啊 06:18 方法好 06:19 但是我们再来看第三个案例 06:21 视频声视频的坏处在什么地方 06:24 那这个视频我也是视频声视频 06:26 我生成三段 06:27 第一段 06:27 第二段 06:28 第三段好 06:29 首先我们来看第一段和第二段 06:34 好注意这个地方的衔接好衔接过来了 06:39 然后进入第二关 06:49 好我们注意啊 06:51 你会发现他的人脸有点奇怪 06:53 是不是就是这种褶皱感 06:54 融化感非常的强 06:56 我们可以看下前面这个人的视频好 06:59 他其实还好 07:00 他整体的画面的这个人脸还是OK的 07:03 那视频声视频的坏处就出现了 07:07 就是在他的这个地方 07:11 人脸的这个地方会出现无限的这种崩坏啊 07:15 就当我们不断延长的时候 07:17 视频越长 07:18 他的脸越奇怪 07:18 我们可以看下回这个视频 07:20 当我继续延长到下一个限度时 07:23 我们可以看到这个地方的人脸看 07:26 已经感觉都要融化了啊 07:28 这个就是视频声视频一个非常大的问题 07:31 就是当你不断的去延长延长延长啊 07:34 尤其里头有人物出现的时候 07:36 他的脸就会成为这个样子啊 07:38 这个就完全崩坏了 07:39 所以视频声视频有个局限 07:40 就是你不能升的太长啊 07:42 最多也就生成一分钟 07:43 如果你再长 07:44 它就会出问题 07:46 那怎么办呢 07:47 那我们就要来到我们的第二个方法 07:50 我们来看第二个方法 07:51 上一个方法我们说了 07:52 是上用一段去导入一个视频作为它的初始 07:55 然后去延长视频 07:56 就可以保证人物的动作空间 07:58 情绪和从上一段进行延续 08:01 那这个坏处刚才也跟大家去看了 08:03 就是他的人脸会出现一定问题 08:05 那所以我们第二个方法是一张图 08:07 去控制下一个镜头 08:08 以上一段视频当中的某一帧作为身份锚点 08:12 去生成下一段视频 08:13 我们具体来看一下案例 08:14 就是图片定帧视频续写 08:16 那它是什么意思呢 08:17 就是我可以去上一段视频当中去截一个针出来 08:22 将这个真放到视频里头 08:24 我用这个图片去延长15秒 08:27 也就是说接下来生成的这个视频呢 08:29 我以这个图片作为开头 08:31 继续生成一个视频 08:32 好我们来看 08:36 这很正常啊 08:38 18年的感情和18年的血缘换我 08:40 我也选感情 08:42 毕竟血缘只是生物学上的概率事件好 08:45 这样也能生成视频好 08:47 那我们具体来看一下它的效果 08:48 那前头是视频声 08:50 视频 08:50 刚才跟大家去讲过 08:51 我们还可以重新来回顾一下好这一段 08:55 然后我直接用视频延长到这一段 08:57 不断就能断的好 08:58 他直接过来了对吧 08:59 我们不能没有他好 09:01 然后接下来我的第二段我就没有用视频延长 09:04 我们可以看这两段是视频延长 09:06 这是视频延长出来的 09:07 那这一段我就不用视频延长 09:09 我用图片延长 09:10 那怎么延长 09:10 我们来看一下理解 09:13 非常理解 09:15 然后延长到这一段 09:16 那为什么要这样做呢 09:18 这就涉及到镜头语言了 09:19 我们来看一下 09:20 那我刚开始的这一帧画面 09:22 就是这个第三个视频的这一帧 09:24 就是我截取第一个视频的第一帧 09:27 然后做过来的 09:28 为什么 09:28 因为整个镜头当中 09:29 以我的实践 09:30 我的自己的感觉来说 09:32 我们走走走 09:34 我们的镜头肯定是从这个画面开始进行拍摄 09:37 首先是三个人站到一起 09:39 然后开始对话 09:40 一个人说 09:40 然后另一个人看 09:41 然后这两个人说 09:42 等到下一段视频呢 09:44 他们都说完了 09:45 该女主说了 09:46 我就回到第一个镜头 09:48 回到第一个镜头 09:49 这是一个镜头语言 09:50 先局先全身在局部 09:53 然后我再回到第一个镜头 09:55 那这样就很好的衔接起来了 09:57 好我们来看回到最开始 09:59 这个符合人的逻辑嘛 10:01 一个镜头就是刚开始是一个全景三个人 10:04 然后给一个交代 10:05 然后继续继续 10:06 然后最后又回到这三个人 10:07 然后女主就后退 10:08 这很正常 10:09 18年的感情和18年的血缘后 10:12 他就后退 10:12 那后退完了之后呢 10:14 我们来看我们再看下一段视频 10:16 沉默成本 10:17 你们在他身上这个地方我又用了什么 10:20 我就没有用视频生成的过程 10:23 我是截取了这一帧 10:25 我截取了这一帧 10:26 他坐下的这一帧截出来 10:28 作为下一段视频的第一帧 10:30 因为我们可以看他坐下来以后 10:33 然后开始镜头跟他们俩说 10:34 然后还是说 10:35 然后结果又换了一个动作好继续开始 10:38 那这个又会连在他身上投资了18年的钱了 10:42 以后呢 10:43 同样我们在下一个镜头我懂 10:46 然后继续再用视频生视频的方法 10:49 视频声视频的方法去生成 10:51 也就是说整段视频我可以用混合生成的方法 10:54 既有视频声视频 10:56 也有图声视频 10:57 也有图生视频 10:59 然后继续视频声视频好 11:01 这两段是视频声视频生出来的 11:04 然后这一段和这一段是图像声 11:06 图片声视频生成出来的 11:08 然后最后一段又是视频声视频生成出来的 11:11 这样就可以避免我们说人脸出现 11:13 刚才的这种融化感 11:14 好这个就是图片定帧视频续写 11:17 也就是混合生成的一种方法 11:19 是第二个方法 11:20 那接下来我们来看到这个方法的一 11:22 些核心关键点 11:24 因为我们刚才给大家去展示的都是文戏 11:26 什么叫文系呢 11:27 就是说话武系的就是打斗 11:29 那文戏其实难度更高 11:31 为什么 11:31 因为我们这有一个核心点 11:33 就是人的正常语速呢是每秒4~5个字 11:36 但是由于我们的镜头被严格控制到4~5秒 11:39 这就意味着单镜头内 11:41 最多你只能说出10~25个台词 11:45 这个一定要记住 11:46 就是我们的人说话 11:47 每秒的正常速度是4~5个字 11:50 所以你在单镜头当中 11:51 让他说的字多于五个字的时候 11:54 就会出现问题 11:55 那我们来看一下会出现什么样的问题 11:57 我们来看第一个案例 11:59 第一个案例是我直接生成的一个片段视频 12:02 我们来看一下在单镜头当中 12:05 就15秒当中 12:06 我说的台词过多会发生什么事情 12:10 三天后 12:10 联邦第12舰队会在这里被伏击 12:12 对方是裂缝军团 12:13 在未知区运营了一年 12:14 第12舰队一旦全面边境区两周变废墟 12:16 他们的舰队是定制系统 12:17 你怎么知道运营一年没公开记录 12:19 还能打正规军好 12:20 大家注意啊 12:20 这个地方语速越来越快了 12:22 大家注意 12:22 一年没公开记录 12:23 还能打正规军系统 12:24 被我们需要人提前进入伏击区找漏洞 12:25 你们有三个王牌飞行员 12:26 但没人能找漏洞 12:27 对吗 12:27 对 12:28 这个就是我最开始去玩极梦的时候 12:31 遇到的一个问题 12:32 我没有注意到一个人 12:34 每秒最多只能说4~5个字 12:36 所以我写了非常多的字 12:37 让他去说 12:38 还能打正规学系统被提前进入 12:40 所以他就特别的快 12:41 特别的啊 12:42 不好感受非常的不好 12:44 这是大家需要注意的一点 12:45 同时我们回到集梦来看一下 12:47 我这个提示词到底是怎么写的 12:49 可以看到我这边说了很多字 12:51 我这边是5~10秒 12:52 让他说了这么多字 12:54 我们刚才说了 12:55 人的每秒最多说4~5个字 12:57 也就是五秒最多25个字 12:59 但是我常常说了这么多字 13:02 这么多字已经超出他的范围 13:03 甚至最后五秒我让女人说了这么多字 13:07 已经超过了他能承受的一个限制了 13:11 所以整个视频的语速会特别特别的快 13:13 非常的不好 13:14 这个是大家需要注意的 13:16 然后需要注意的 13:17 第二点就是长台词的多镜头调度 13:19 那如果我们遇到非常长的这种台词 13:22 那绝对不要把台词都塞到一个镜头当中 13:25 必须结合说话者的语气和气口进行剪切 13:29 将它规划成两个或者更多的镜头 13:32 那它是什么意思呢 13:33 我们先把这个看完 13:35 然后我们再结合第三个来看 13:37 那第三个就是在切台词的时候呢 13:40 不要一直怼着人脸进行说话 13:42 必须穿插不同的机位 13:44 比如说A镜头人说了三秒拍中景 13:46 然后B镜头就是切到他给听他说话的 13:49 这个人的反镜头 13:50 那接下来的镜头再切回说话人 13:53 也就是中井说话人 13:54 然后B景的听着人的反应 13:56 然后C警给这个说话人在一个特写 13:59 那我们具体来看一个案例 14:01 那还是来到我们刚才举的这个例子 14:03 我们可以看到这个例子 14:05 我给的镜头就是他说话对吧 14:07 她说到五秒以后就切这个女主 14:10 切完女主以后再切回他们进行说话 14:13 然后再切回女主 14:14 然后再给一个全景 14:16 然后再切到女主说话 14:17 然后再切到女主的一个镜头全景坐下 14:20 那整个的时候你不能直接怼着一个人 14:23 那什么叫怼着一个人 14:25 比如说这个画面啊 14:26 一直冲着这个穿粉裙子的这个女的 14:29 让她直接说完整个台词 14:31 这样是非常糟糕的 14:32 你每一个镜头要进行一个镜头的调度 14:35 好 14:36 这个就是我们说的第二种方法的 14:38 一些大家要规避的问题 14:40 好我们来看第三个方法 14:41 第三个方法其实也比较简单 14:43 就是九宫格 14:44 就是我们只需要生成两张九宫格图片 14:47 比如说一会儿我给大家去展示 14:48 这个小猫偷面包的一个九宫格 14:50 第一个是小猫进入面包店 14:52 看到面包把面包拿出来 14:54 然后妙妙店主看到了追他 14:56 然后他跑好 14:57 我们看到最后一帧是这个样子的 15:00 然后开头的第二个我会延续这一帧 15:03 继续发生故事 15:04 那接下来就非常好处理了 15:06 我们只需要把这两个给到c dos2.0 15:08 直接生成视频 15:09 那我们来看一下效果好 15:11 这个就是我们的小猫视频 15:13 同时可以看到第一个就是我们的第一个画面 15:16 到这个地方结束 15:17 然后第二个就是生成第二个画面 15:19 然后到这个地方我们也就结束 15:21 我们可以看一下效果 15:22 我们先把这个隐藏起来好 15:25 我们来看小猫进来 15:26 然后叫一声 15:27 然后看到面包 15:28 然后它把面包拿出来 15:30 嘿然后人看到了去追他 15:32 然后脱离了人 15:33 然后进入下一个阶段 15:34 看切过来了 15:35 这个就是九宫格的下一个阶段切过来了 15:37 然后遇到小狗 15:39 然后他们去分这个分这个面 15:41 然后去吃 15:42 然后然后分给大家吃好 15:43 就是整个过程 15:44 这个就是用九宫格 15:46 就是你只需要生成两张九宫格 15:47 我们所看到这个九宫格 15:49 然后给到z down加A0 15:50 按九宫格生成 15:51 然后你直接拼接起来就好了 15:52 非常的简单 15:53 但是在做这种视频的时候也有一些问题 15:56 什么问题呢 15:57 我们要注意就是我们不要去给视频 16:00 给这个视频音频 16:02 我们来看一下这个音频都是我自己配的 16:05 而它本身是没有任何声音的 16:07 好我们现在把这两个音频给大家禁掉 16:09 我们还原到原本这两个视频的声效 16:12 我们来看一下它的效果 16:14 我们来看它原来是有音效的 16:15 我是故意把它生成音效的 16:18 他是有音效啊 16:19 有音效还有背景音乐好 16:21 如果我们按九宫格去生成的话 16:23 我们不加以限制 16:25 就是让它生成背景音乐 16:26 会发生什么事情呢 16:27 我们注意这两个衔接点 16:32 好看到了吧 16:34 声音导致两段啊衔接起来非常的奇怪 16:38 非常非常的奇怪 16:40 喵哎这边的音乐和这边的音乐都不一样啊 16:44 所以最好的办法就是让它生成的时候 16:46 不要生成音乐 16:47 不要生成音乐 16:48 我们自己给他配乐 16:49 那这样的整体用声音就可以把这两段连接起来 16:52 那如果你想让两个视频连接起来 16:55 不仅是要画面一致 16:57 你的声音也要一致 16:58 这样才好 16:58 我们来看一下这个效果好 17:02 因为声音一致 17:03 所以他就很好的去切过来了 17:05 好这个就是九宫格的制作方法 17:06 和我们要注意的一点好 17:09 接下来我们来看下一个生成方法 17:11 就是故事版啊 17:12 故事版生成是最近非常流行的 17:14 但是市面上跟大家去分享的故事版 17:17 都是生成15秒的 17:19 那故事版怎么生成长视频 17:21 长时间的视频就像我们刚才所说的 17:23 能连接起来 17:24 那我们就需要生成多张故事版啊 17:27 这是第一章故事版好这是第二章故事版 17:30 我们可以看第一章故事版的结尾的这个画面 17:33 跟下一章故事版的这个内容一定要一致啊 17:37 就是我的一个主人公拿着变声器 17:40 把这个卡片送进去了以后 17:42 然后下一个故事版就要切啊 17:44 主人公拿着这个变声器啊 17:46 给到镜头的一个画面 17:48 然后这个画面最后是蓝色漩涡真人变身 17:51 那我下一个也要切 17:52 说他变身的时候具体是怎么变的 17:54 好 17:55 我们来看一个真实的案例 17:56 我们怎么把这三个故事版拼接到一起 17:58 好我们来看这个视频 18:00 那这个视频呢我也把视频放到了我的主页 18:03 大家直接可以去看 18:05 那上面是故事版 18:06 下面是提示词 18:07 我们可以看一下它是怎么进行衔接的 18:09 注意看这个故事版 18:14 好注意指标 18:17 有一个视频就15秒 18:19 马上就要到图书馆时间段 18:21 好放进去了 18:24 到下一步了 18:25 大家看到了吗 18:26 放进去了就到下一个超进化组件S穿越跳舞跳 18:32 跳到好休息15秒 18:36 也就到30秒的 18:37 下一个关注好到这了 18:39 下个步进步 18:41 下一步要进入到加油是吧 18:47 好大家看到了吗 18:48 从上面的这个要进入到下一个 18:58 You can not fight 19:01 And you will have 19:03 好 19:03 这个就是长视频的故事版的制作方法 19:06 其实非常的简单啊 19:08 没有什么特别玄的理论或者道理 19:11 全都是啊我自己通过一些实践呀 19:13 啊通过一些摸索就是摸索出来的 19:16 但是大家如果想继续生成更好的视频 19:19 那我们需要去学一下视听语言 19:21 包括镜头的推拉摇移 19:23 然后焦距该怎么拍啊 19:25 这都是非常就是编导或者编剧要去做的事情了

简介 ​

字幕 ​

简介

字幕